Introduction aux agents de résolution de problèmes

De la réflexivité à la planification

Dans l'évolution de la conception des agents, nous passons des Agents Réflexes, qui associent les percepts directement aux actions sur la base de règles simples (par exemple, « Si la voiture devant freine, freiner »), aux Agents de Résolution de Problèmes. Les agents réflexes opèrent dans un contexte immédiat, tandis que les agents de résolution de problèmes sont Basés sur des objectifs. Ils considèrent les conséquences futures de leurs actions pour trouver une séquence qui satisfasse un objectif spécifique.

Agent Réflexe : $Action = Fonction(Percept)$
Agent de Planification : $Séquence\_d'Actions = Recherche(État, But)$

La Représentation d'État Atomique

À ce niveau fondamental, les agents utilisent une Représentation Atomique. Cela signifie que l'état du monde est traité comme une boîte noire — un nœud singulier sans structure interne visible par l'algorithme de recherche. L'agent raisonne uniquement sur :

États ($S$) : Instantanés de l'environnement.
Actions ($A$) : Transitions entre les états.
Test de But : Une vérification booléenne si l'état $s \in S_{goal}$.

La Boucle de Résolution de Problèmes

Un agent de résolution de problèmes suit un cycle distinct en quatre étapes pour naviguer dans l'environnement :

Formulation du But : Décider quel objectif poursuivre en fonction de la situation actuelle.
Formulation du Problème : Abstraire le monde réel en un modèle mathématique (États et Actions).
Recherche : Simuler des séquences d'actions pour trouver le chemin optimal.
Exécution : Effectuer les actions trouvées pendant la phase de recherche sans autre délibération (en supposant un environnement statique).

Implémentation Python (agent_types.py)

class ReflexAgent :
defact (self, percept) :
# Mappage direct : Règle -> Action
return règles.get(percept, default_action)
class ProblemSolvingAgent :
def__init__ (self):
self.seq = [] # Séquence d'actions mise en mémoire tampon
defact (self, percept) :
# Si nous sommes en cours d'exécution, continuer
ifself.seq :
returnself.seq.pop (0()
# Sinon, Planifier (Rechercher)
        state = self.update_state(percept)
        goal = self.formulate_goal(state)
        problem = self.formulate_problem(state, goal)
# La recherche renvoie une liste d'actions
self.seq = search_algorithm(problem)
returnself.seq.pop (0()